Testes de Mercado e Metodologia Quantitativa
Universidade de Brasília
2024-12-12
Quantas pessoas são necessárias em um grupo para que a probabilidade de pelo menos duas delas compartilharem o mesmo aniversário seja maior que 90%?
Mas!
Compreender probabilidades ajuda a tomar decisões informadas e a diminuir erros.
Uma função \(\mathcal{P}\), definida na \(\sigma\)-álgebra \(\mathcal{A}\) de subconjuntos de \(\Omega\),e com valores entre [0,1], é dita uma probabilidade se ela satisfaz aos axiomas de Komolgorov:
P(\(\omega\)) = 1;
\(\mathcal{P}(A) \geq 0, \quad \forall A \in \mathcal{A}\);
Se \((A_1, A_2, A_3, \dots \in \mathcal{A})\) são eventos disjuntos dois a dois (\((A_i \cap A_j = \emptyset\)) para \((i \neq j)\)), então:
\[ P(\bigcup_{i=1}^\infty A_i = \sum_{i=1}^\infty P(A_i) \]
Amostragem é um processo estatístico de seleção de uma parte representativa de uma população para realizar uma inferência sobre esta população.
Pesquisa Distrital por Amostra de Domicílios
33 (à época) Regiões Administrativas do Distrito Federal
Foram visitados ~ 35 mil domicílios.
O requisito central é que existe o cadastro dos entrevistados potenciais (domicílios), fornecido pelo IBGE
Extrair informações de uma amostra para fazer inferências sobre a população.
A teoria e os estudos de probabilidade fornecem a base matemática em amostras probabilísticas.
A fórmula para calcular o tamanho da amostra \(n\) ao estimar uma média é dada por:
\[ n = \frac{z^2 \cdot \sigma^2}{e^2} \]
Para estimar a uma proporção, podemos usar a variância máxima.
\[ n = \frac{z^2 \cdot p(1-p)}{e^2} \]
\[ n = \frac{1.96^2 \cdot 0.5(1-0.5)}{0.05^2} = \frac{0.0025}{0.9604} \approx 384.16 \]
\[ n_{ajustado} = \frac{n_0}{1 + \frac{n_0 - 1}{N}}= \frac{385}{1 + \frac{385 - 1}{200}} = 132 \]
\[ n = \frac{1.96^2 \cdot 4}{2^2} = 3.8416 \approx 4 \]
Mais que tamanho da amostra
N = 1000 pessoas de consumidores de um novo streaming. Quanto estão dispostos a pagar em média.
Qual o tamanho da amostra necessário nesse caso
Pela fórmula inicial, precisaríamos de 795 pessoas.
Ajustando para populações pequenas, 443.
Amostra Aleatória Simples:
Não aleatória: Coletada na ordem em que a população foi gerada.
Média de 41.8
IC de 95%: (39.9 e 43.7).
Lembre
A média real é de 68.9.
Veja!
Mesmo uma amostra maior, a média ainda está distante da média real (round(mean(populacao),1)) da população por não ser aleatória.
Limitações pesquisas amostrais probabilísticas
Custo: Amostragem probabilística é mais cara que a não probabilística.
Tempo: Pode ser mais demorada.
Complexidade: Requer conhecimento técnico.
Acesso: População desconhecida ou não acessível.
É preciso definir bem qual é a população de interesse.
Amostragem estratificada
Pode-se melhorar a representatividade na amostra com o uso de estratificação (por setor, tamanho da empresa, etc.)
Dividir a população em subgrupos (estratos) com características semelhantes.
Outra forma de calcular o n, com diferentes possibilidade de alocação.
Veja!
O tamanho n diminuiu em relação à AAS, sem perda de precisão.
Veja!
A média real da população é de 68.9. A estimativa já ficou bem melhor do que a coleta não aleatória de ~700 pessoas, mesmo também não sendo aleatória.
Lembre!
A média real da população é de 68.9.
Pode ajudar a entender o tamanho da população de consumidores, por exemplo.
Por exemplo, de acordo com a PDAD 2021 :
Possibilidades
Manter ordem lógica no questionário.
Evitar perguntas tendenciosas.
Piloto para testar a compreensão e a eficácia.
“Com que frequência você estuda para as provas das disciplinas?”
( ) Nunca
( ) Raramente
( ) Algumas vezes
( ) Frequentemente
( ) Sempre
“Quantos dias por semana, em média, você estuda para as provas das disciplinas?”
( ) 0 dias
( ) 1-2 dias
( ) 3-4 dias
( ) 5-6 dias
( ) Todos os dias (7 dias)
“Você está satisfeito com o ensino na sua faculdade?”
( ) Sim
( ) Não
A pergunta é ampla demais.
Não capta nuances de opiniões.
Não há informações sobre quais aspectos precisam de melhorias.
“Há barreiras à livre circulação interestadual do produto X no Brasil? Explique, considerando fatores como custos de transporte, impostos etc.”
Existem barreiras à livre circulação interestadual do produto X no Brasil? (Sim/Não)
Quais são os principais fatores que contribuem para essas barreiras? (Opções: Custos de transporte, impostos, regulamentações estaduais, outros).
Se outros, por favor, especifique.
“Informe se, caso as Requerentes deste Ato de Concentração viessem a aumentar o preço do produto X após a Operação (por exemplo, em um patamar entre 5% e 10%), sua empresa: (i) continuaria adquirindo os produtos desses fornecedores, ou (ii) substituiria os produtos das Requerentes por produtos de outro(s) fornecedor(es), conseguindo ter sua demanda integralmente atendida. Justifique.”
Longa, múltiplos parênteses que podem confundir.
Combina uma pergunta fechada aberta.
Pergunta Adicional (Opcional): - “Por favor, explique os fatores que influenciariam essa decisão (ex.: disponibilidade de fornecedores alternativos, custo-benefício, impacto na qualidade do produto final).”
Maneiras de minimizar impacto de não respostas:
Se souber de antemão a taxa, aumenta-se n.
Exemplo:
Exemplo:
Exemplo: Se um estrato deveria representar 30% da população, mas representa apenas 20% na amostra final, multiplique os pesos desse estrato por ( 1.5 ).
\[ Viés = W_{nr} \cdot (Y_{r} - Y_{nr}) \]
Variáveis contínuas
O intervalo é muito amplo, e as suposições sobre o comportamento dos não-respondentes são mais complexas.
Ex: proporção de pessoas que concordam com uma decisão.
Mais fácil, pois está sempre entre [0, 1]
Podemos fazer intervalos conservadores:
Uma possibilidade é Regressão: Com base nos respondentes, preveja para os não-respondentes.